ارائه رهیافتی جدید از کاربرد الگوریتم های فرامکاشفه ای در مسأله انتخاب ویژگی برای مجموعه داده های بزرگ
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی
- نویسنده محسن شفیعی
- استاد راهنما رضا منصفی داود کریم زادگان
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
دسترس پذیری بالای داده ها در جوامع اطلاعاتی کنونی، وجود ابزاری معتبر و کارآمد به منظور مدل سازی و تحلیل داراییهای با ارزش (اطلاعات) را ملموس تر می نماید. از موانع مهم در استفاده ابزارهای داده کاوی در این راستا حجم بالای داده های مورد بررسی است که هزینه های زمانی و تحلیلی زیادی را به دنبال دارد. در اغلب موارد می توان با حذف داده های زائد وبی ارزش علاوه بر کاهش هزینه های کاوش، صحت نتایج تولیدی را نیز تا حد قابل قبولی حفظ کرد. انتخاب ویژگی یکی از روش هایی است که سعی دارد با کاهش تعداد صفات داده های مورد بررسی هزینه های داده کاوی را کاهش دهد، ولی از آن جا که خود روال انتخاب ویژگی مناسب جزو مسائل np-complete است، می توان به جای تولید پاسخ قطعی با صرف زمان قابل ملاحظه، به دنبال رسیدن به پاسخ قابل قبول باشیم. استفاده از رویکرد فرامکاشفه ای برای این منظور مناسب و پرکاربرد است، در این پایان نامه با ترکیب و ایجاد تغییرات مناسب در روش های متداول فرامکاشفه ای مانند روش کلونی مورچه ها، جستجوی هارمونیک و بهینه سازی ذرات هوشمند توانسته ایم به ایجاد بهینگی در این روش ها برای حل مسأله انتخاب ویژگی دست یابیم، که نتایج حاصل از اعمال این تغییرات با شبیه سازی انجام شده با نرم افزار متلب و بر روی مجموعه داده های بزرگ و معتبری مانند گیست و درثا که به منظور استفاده در روش انتخاب ویژگی مناسب سازی شده است اعمال و نتایج حاصل تایید کننده بهینگی روش مورد بررسی است.
منابع مشابه
مدلسازی رواناب ماهانه با استفاده از روشهای داده کاوی براساس الگوریتم های انتخاب ویژگی
باتوجه به اهمیت مقدار جریان خروجی از حوضه آبریز جهت مدیریت آبهای سطحی، فهم دقیق ارتباط بین مقدار رواناب با پارامترهای اقلیمی همچون بارش و دما و شناسائی موثرترین پارامتر در فرآیند مدلسازی بسیار مهم میباشد. در این تحقیق پس از آزمون همگنی دادههای بارش، دما و رواناب ماهانه حوضه آبریز ناورود، ابتدا براساس دو الگوریتم رلیف و همبستگی دو ترکیب مختلف از پارامترهای موثر در رواناب مورد توجه قرار گرفت....
متن کاملارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...
متن کاملکاربرد الگوریتم های داده کاوی در تشخیص داده های ژئوشیمیایی خارج از ردیف چند متغیره
تشخیص دادههای خارج از ردیف چند متغیره به کمک الگوریتمهای دادهکاوی یکی از نکات ضروری پیشپردازش دادههای اکتشافات ژئوشیمیایی محسوب میشود. در این مقاله چهار الگوریتم برآورد چگالی کرنل (KDE)، ضریب خارج از ردیف بودن محلی (LOF)، OPTICS-OF و SVDD که به ترتیب جزو روشهای آماری، روشهای مبتنی بر مجاورت، روشهای مبتنی بر خوشهبندی و روشهای مبتنی بر دستهبندی هستند، معرفی شده و کاربرد آنها بر روی دا...
متن کاملارائه یک روش جدید برای تخمین مقادیر گمشده در مجموعه داده
اغلب مجموعه داده های مربوط به داده کاوی و ماشین یادگیری دارای داده هایی با مقادیر Missing Values یا داده گمشده می باشند. چگونگی برخورد با داده گمشده و نیز ارائه راهکارهایی مبتنی بر تخمین مقدار مربوط به داده گمشده، منجر به بروز یک مسئله بسیار مهم در زمینه داده کاوی و ماشین یادگیری شده است. در بین الگوریتم های داده کاوی، الگوریتم C4.5، به دلیل کارآیی، استفاده در کاربردهای مختلف داده کاوی و نیز ت...
متن کاملارائه یک مدل جدید ریاضی برای مسأله مسیریابی سرویس مدارس و حل آن توسط الگوریتم پیشنهادی
مقاله حاضر در خصوص ارائه و حل یک مدل مسیریابی سرویس مدارس است. مسیریابی سرویس مدارس حالت خاصی از مدل مسیریابی است. در مدل ارائهشده، بر خلاف بسیاری از مدلهای ریاضی مطرحشده در این زمینه، مکانیابی و مسیریابی ایستگاهها، همزمان در نظر گرفته میشوند و خودروهای آن غیرهمگن هستند. از سوی دیگر به جای مکانیابی مدارس که در نقش مراکز توزیع عمل میکنند، ما سعی در مکانیابی ایستگاه-های اتوبوس داریم که د...
متن کاملاستراتژیهای جدید حافظ تنوع برای الگوریتم ژنتیک و کاربرد آن برای بهینهسازی مقیاس بزرگ
جهت افزایش کارایی الگوریتم ژنتیک، رویکردهای فراوانی باهدف حفظ تنوع منتشر شده است. باوجود این، اکثر این رویکردها فقط میتوانند روی مسائل بهینهسازی پیوسته اعمال شوند. این بدان معنا نیست که الگوریتمهای ژنتیک در حل مسائل بهینهسازی گسسته به تنوع جمعیت نیاز ندارند. در حقیقت، تعریف مفهوم تفاوت بین جوابهای راهحلهای مسائل بهینهسازی گسسته، با توجه به تفاوت ظاهری آنها ساده نیست. برای مثال در مسئله...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023